137 research outputs found

    Self-Organized Ordering of Terms and Documents in NSF Awards Data

    Get PDF
    We present the results of an analysis of a text corpus of 129,000 abstracts of NSF-sponsored basic research projects between years 1990 and 2003. The methods used in the analysis include term extraction based on a reference corpus and an entropy measure, and the Self-Organizing Map algorithm for the formation of a term map and a document map. Methodologically, the basic approach is based on earlier developments, such as word category maps and the WEBSOM method, but in the level of details, we report several new aspects and quantitative comparison results between methodological variants in this article. The data covers a quite large proportion of US-based scientific research during recent years. The analysis results indicate the basic patterns discernable in the data, both at the level of the awards and at the terminology used in them

    Co-Operation as an Asymmetric Form of Human-Computer Creativity. Case: Peace Machine

    Get PDF
    This theoretical paper identifies a need for a definition of asymmetric co-creativity where creativity is expected from the computational agent but not from the human user. Our co-operative creativity framework takes into account that the computational agent has a message to convey in a co-operative fashion, which introduces a trade-off on how creative the computer can be. The requirements of co-operation are identified from an interdisciplinary point of view. We divide cooperative creativity in message creativity, contextual creativity and communicative creativity. Finally these notions are applied in the context of the Peace Machine system concept.Peer reviewe

    Kunnioitusta erilaisuutta kohtaan

    Get PDF
    Edellisten eduskuntavaalien tulos ja sen jälkipuinti ovat tuoneet esille monenlaisia yhteiskunnassamme kyteneitä jännitteitä. Yksi tulkinta näille jännitteille on taloustaantumien ja niiden kautta kehittyneiden turhautumisten kanavoituminen syyllisten etsimiseksi. Ongelmien aiheuttajiksi koetaan vaikkapa suomenruotsalaiset, maahanmuuttajat tai taloudellinen eliitti. Tilanne on kärjistynyt tasolle, jossa kansanedustajatkaan eivät enää ole sanoissaan pidättyväisiä vaan käyttävät rasistisia ilmauksia tai ilmaisevat vähintään epäsuoraa vihaa joitakin kansanryhmiä kohtaan

    Tiedeorkesterin mielet ja kielet

    Get PDF
    Kymmenkunta vuotta sitten minulle tarjoitui mahdollisuus esitellä suomalaista kulttuuria ja luontoa englantilaiselle viulistille ja professorille Paul Robertsonille hänen vieraillessaan Suomessa luennoimassa. Robertson on Medici-kvartetin perustajajäsen mutta myös ehtinyt tutkia laajasti musiikin vaikutusta ihmismieleen. Hän kertoi varsin erikoisen esimerkin siitä, kuinka London Symphony Orchestraan valittiin monien lahjakkaiden ehdokkaiden joukosta kuuro orkesterin jäsen. Esimerkki kertoo yleisellä tasolla siitä, kuinka ihmisellä voi olla huippuosaamista periaatteessa mahdottomista lähtökohdista huolimatta – ja joskus jopa niiden ansiosta

    Tieteenalojen erilaiset lähestymistavat

    Get PDF

    Adaptive Translation : Finding Interlingual Mappings Using Self-Organizing Maps

    Get PDF
    Volume: 5163This paper presents a method for creating interlingual word-to-word or phrase-to-phrase mappings between any two languages using the self-organizing map algorithm. The method can be used as a component in a statistical machine translation system. The conceptual space created by the self-organizing map serves as a kind of interlingual representation. The specific problems of machine translation are discussed in some detail. The proposed method serves in alleviating two problems. The main problem addressed here is the fact that different languages divide the conceptual space differently. The approach can also help in dealing with lexical ambiguity.Peer reviewe

    Subjects on Objects in Contexts : Using GICA Method to Quantify Epistemological Subjectivity

    Get PDF
    A substantial amount of subjectivity is involved in how people use language and conceptualize the world. Computational methods and formal representations of knowledge usually neglect this kind of individual variation. We have developed a novel method, Grounded Intersubjective Concept Analysis (GICA), for the analysis and visualization of individual differences in language use and conceptualization. The GICA method first employs a conceptual survey or a text mining step to elicit to elicit from varied groups of individuals the particular ways in which terms and associated concepts are used among the individuals. The subsequent analysis and visualization reveals potential underlying groupings of subjects, objects and contexts. One way of viewing the GICA method is to compare it with the traditional word space models. In the word space models, such as latent semantic analysis (LSA), statistical analysis of word-context matrices reveals latent information. A common approach is to analyze term-document matrices in the analysis. The GICA method extends the basic idea of the traditional term-document matrix analysis to include a third dimension of different individuals. This leads to a formation of a third-order tensor of dimension subjectobjectcontexts. Through flattening, these subject-object-context (SOC) tensors can be analyzed using different computational methods including principal component analysis (PCA), singular value decomposition (SVD), independent component analysis (ICA) or any existing or future method suitable for analyzing high-dimensional data sets. In order to demonstrate the use of the GICA method, we present the results of two case studies. In the first case, a GICA analysis of health-related concepts is conducted. In the second one, the State of the Union addresses by US presidents are analyzed. In these case studies, we apply multidimensional scaling (MDS), the self-organizing map (SOM) and Neighborhood Retrieval Visualizer (NeRV) as specific data analysis methods within the overall GICA method. The GICA method can be used, for instance, to support education of heterogeneous audiences, public planning processes and participatory design, conflict resolution, environmental problem solving, interprofessional and interdisciplinary communication, product development processes, mergers of organizations, and building enhanced knowledge representations in semantic web.Peer reviewe

    Self-Organized Ordering of Terms and Documents in NSF Awards Data

    Get PDF
    We present the results of an analysis of a text corpus of 129,000 abstracts of NSF-sponsored basic research projects between years 1990 and 2003. The methods used in the analysis include term extraction based on a reference corpus and an entropy measure, and the Self-Organizing Map algorithm for the formation of a term map and a document map. Methodologically, the basic approach is based on earlier developments, such as word category maps and the WEBSOM method, but in the level of details, we report several new aspects and quantitative comparison results between methodological variants in this article. The data covers a quite large proportion of US-based scientific research during recent years. The analysis results indicate the basic patterns discernable in the data, both at the level of the awards and at the terminology used in them

    Modelo de comprensión de frases en un micromundo y posible aplicación al campo de la traducción máquina

    Get PDF
    El trabajo realizado está dividido en dos fases principales. Primero se estudia la comprensibilidad de sentencias escritas y la representación en planos bidimensionales de las situaciones referidas por dichas sentencias. Posteriormente, el modelo desarrollado se utiliza para estudiar su adecuación en tareas de Traducción Máquina en las que se ha de tener en cuenta información contextual. En la primera fase del proyecto se desarrolla un modelo que posibilita la representación de situaciones en un micromundo utilizando el mapa auto-organizativo SOM y el procesamiento de frases sencillas que describen dichas situaciones mediante el uso de una red neuronal recurrente simple (SRN). El mapa SOM es entrenado sobre un conjunto de situaciones ejemplo que conforman la experiencia del sistema y posibilitan la representación en el espacio de salida SOM del modelo cualquier situación posible. A continuación, un conjunto de frases es entrenado mediante la red SRN para posibilitar la transformación de frases a situaciones, resultando en su conjunto un modelo que recibe como valor de entrada una frase describiendo una determinada situación y muestra como salida, en el caso ideal, la representación de dicha situación sobre el mapa SOM. La red SRN permite contar con información contextual basada en la información recibida en entradas previas, por lo que el modelo desarrollado resulta adecuado para tareas relacionadas con el procesamiento de lenguaje y, más concretamente, con la comprensión de frases e historias. Además, el espacio SOM de salida del modelo resulta ser independiente tanto del lenguaje utilizado en la entrada y su estructura proposicional como del número de situaciones que forman el conjunto de entrenamiento o experiencia, posibilitando la formación de un espacio sobre el cual poder realizar razonamientos lógicos básicos como si de un diagrama Venn se tratara. En los experimentos realizados se muestra cómo el modelo no sólo es capaz de comprender frases a las que había sido entrenado, sino que también es capaz de generalizar, comprendiendo frases que no habían sido presentadas en el entrenamiento y que describen situaciones nuevas. En la segunda fase del proyecto se diseña e implementa un sistema basado en el trabajo realizado en la primera fase con el que se pretende estudiar qué posibilidades ofrece el modelo siendo base o componente de un modelo que permita llevar a cabo tareas de Traducción Máquina (MT), prestando especial atención a aquellos casos donde la frase o palabra de entrada puede presentar diversas traducciones y esta ambigüedad ha de resolverse atendiendo al contexto de la situación. El espacio de salida SOM se utiliza ahora como espacio único de representación conceptual compartido por dos microlenguajes que difieren en la manera en la que relacionan los símbolos léxicos con los conceptos, uno de ellos basado en el español y el otro en el inglés. Dicho espacio situacional compartido por ambos microlenguajes realiza la función de componente intermedio en la tarea de traducción a partir del cual se extrae información contextual y conceptual de la situación descrita por la frase de entrada, útil para producir como salida la nueva frase traducida. De manera paralela al entrenamiento del espacio SOM, dos nuevos mapas SOM de mismo tamaño, uno para cada microlenguaje, son entrenados tomando como entrada la información conceptual presente en las situaciones del conjunto experiencia. Cada uno de estos mapas presenta la organización de las palabras del microlenguaje en base a su relación conceptual, de forma que aquellas palabras que poseen mayor similitud conceptual y/o son utilizadas para expresar situaciones similares aparecen dispuestas más próximas en estos mapas de vocabulario, que se utilizan en el proceso de producción de la frase traducida. Este proyecto es una extensión de un trabajo publicado junto con el profesor Timo Honkela en la Conferencia Internacional de Redes Neuronales Artificiales (ICANN) de Septiembre de 2010: Elementary Logical Reasoning in the SOM Output Space
    corecore